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基于 slope one 算法 改进 评分 和 矩阵 填充 的 协同 过 滤 算 法 研究 
向 小 东 ， 印 梓 威 


(福州 大 学 经 济 与 管理 学 院 , 福州 350116) 


摘 要 : 为 解决 协同 过 滤 算 法 中 的 数据 稀 政 性 问题 ， 提 出 了 一 种 改进 的 协同 过 滤 算 法 。 该 算法 使 用 slope one 算法 计算 
出 来 的 评分 预测 值 来 填充 评分 矩阵 中 的 未 评分 项 目 , 然后 在 填充 后 的 用 户 -项 目 评 分 矩阵 上 通过 基于 用 户 的 协同 过 滤 方 
法 给 出 推荐 。 利 用 slope one 莫 法 计算 出 来 的 评分 预测 值 作为 回填 值 ， 既 能 降低 评分 矩阵 的 稀疏 性 ， 也 保证 了 回填 值 的 
多 样 性 ， 从 而 减少 均值 、 中 值 等 单一 填充 值 造 成 的 推荐 误差 。 在 MovieLens-1M 数据 集 上 对 本 文 改进 算法 和 协同 过 滤 
算法 及 均值 中 心 化 处 理 的 算法 作 五 折 交 叉 实验 ， 结 果 表明 ， 基 于 评分 预测 值 填 充 数 据 后 的 协同 过 滤 算 法 有 效 的 缓解 了 
数据 稀疏 性 问题 ， AR 
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Research on collaborative filtering algorithm based on slope one algorithm 
to improve score matrix filling 


Xiang Xiaodong, Qiu Zixian 
(School of Economics & Management, Fuzhou University, Fuzhou 350116, China) 


Abstract: In order to solve the problem of data sparsity in the collaborative filtering algorithm, this paper proposes an improved 
collaborative filtering algorithm. The algorithm fills the unrated items in the scoring matrix using the prediction value calculated 
by the Slope One algorithm and then gives recommendations based on the user-based collaborative filtering method based on 
the filled user-item scoring matrix. Using the predictive value of Slope One algorithm as the backfill value can not only reduce 
the sparsity of the scoring matrix, but also ensure the diversity of backfill values, so as to reduce the recommended error caused 
by the single fill value such as mean value and median value. Half off cross-validation experiments were performed on the 
movielens-1M dataset. The results show that the collaborative filtering algorithm based on the score prediction data effectively 
mitigates data sparsity and has better performanceRecommended effect. 
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recommendation 
引言 是 协同 过 滤 算法 的 一 大 难题 ， 对 此 ， 国 内 外 学 者 进行 了 大 量 的 
加 研究 记 。 冷 亚军 等 全 认 为 数据 稀疏 性 问题 会 从 近邻 搜寻 不 够 


近年 来 ， 随 着 科技 的 进步 和 网 络 技术 的 不 断 发 展 ， 网 络 信 准确 和 近邻 评分 过 少 两 方面 对 协同 过 滤 产 生 不 利 影响 。 备 详 武 
息 以 爆炸 式 增长 ， 导 致 用 户 的 真正 需求 淹没 在 大 量 无 关 信息 和 等 人 外 针对 推荐 系统 中 的 数据 稀疏 性 和 冷 启动 等 问题 ， 对 社会 


I 


f 化 的 产品 中 ， 使 得 用 户 花 费 大 量 的 时 间 还 不 一 定 能 找到 自 ”化 推荐 系统 在 信任 推理 以 及 推荐 关键 技术 等 方面 做 了 比较 全 面 


趣 
在 


哮 


在 影视 、 新 闻 、 电 1 


己 需要 的 商品 ， 信 息 过 载 问题 又 竺 有效 解 决 ， 另 一 方面 ， 随 着 ”的 综述 。 孔 欣欣 等 人 喇 提 出 了 一 种 标签 权重 的 评分 方法 来 最 大 


社会 的 发 展 和 人 们 对 个 性 化 的 追求 ， 如 何 满 足 每 个 人 独特 的 兴 ”化 地 降低 客观 因素 对 用 户 评分 的 影响 ， 有 效 缓解 了 用 户 的 订 
性 好 也 是 个 难题 。 在 此 背景 下 ， 个 性 化 推荐 技术 应 运 而 生 并 “偏差 问题 。Li 等 人 名 为 解决 推荐 系统 数据 稀 玻 性 及 精度 过 低 的 


分 


平台 、 高 校 图 书馆 等 迅速 兴起 并 不 断 发 展 。 问题 ， 提 出 了 一 种 结合 用 户 评 分 信任 和 


Kenn 


了 


户 偏好 信任 改善 


个 性 化 推荐 技术 中 运用 的 推荐 算法 虽 不 尽 相 同 ， 但 基于 协 ” 相似 性 来 计算 的 协同 过 滤 算 法 。Songjie 等 人 中 指出 可 以 


同 


过 


分 


聚 类 


区 


滤 算 法 的 推荐 由 于 其 简单 性 、 准 确 性 、 有 效 性 等 优势 成 为 。 来 改善 相似 度 的 计算 。Lu 等 人 名 提出 了 一 种 基于 缺失 值 迭 代 预 
用 最 广泛 的 个 性 化 推荐 算法 口 。 数 据 稀 疏 性 一 直 以 来 都 测 填充 的 协同 过 滤 算 ， 不 仅 能 够 降低 数据 稀 疏 性 的 还 提高 了 月 


应 


前 
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于 项 目的 方法 融合 到 协同 过 滤 中 ， 降 低 用 户 项 目 和 矩阵 的 规模 从 
而 有 效 缓解 了 数据 稀疏 的 问题 .Yang 等 人 00 提 出 一 种 结合 用 户 


Chinaxiv 合 作 期 刊 ， 
录用 稿 向 小 东 ， 等 : 基于 SlopeOne 算法 改进 评分 矩阵 填充 的 协同 过 小 算法 研究 
户 相 似 度 计算 精度 问题 。Vozalis 等 人 外 把 奇异 值 分 解 方法 和 基 年 代 中 期 开发 推荐 系统 Tapestry 时 提出 。 近 年 来 随 着 学 者 们 对 


协同 过 滤 的 深入 研究 和 应 用 。 将 各 种 相关 技术 同 协同 过 滤 推 荐 
算法 结合 使 用 , 当前 协同 过 滤 的 一 种 经 典 分 类 方法 如 图 1 所 示 。 


言 任 关 系 的 改进 协同 过 滤 算 法 ， 通 过 集成 用 户 提供 的 稀 玻 评估 
数据 和 稀 玻 的 社交 信任 网 络 来 提高 协作 过 滤 的 推荐 性 能 ， 并 在 
四 种 数据 集 上 验证 了 改进 算法 的 推荐 效果 。 

从 这 些 算法 的 仿真 结果 可 以 看 出 推荐 系统 的 质量 得 到 了 提 
升 ， 但 仍然 难以 完美 解决 协同 过 滤 算 法 中 存在 的 所 有 问题 ， 比 
如 空 值 填补 法 中 若 采 用 缺 省 值 《 即 用 户 评分 中 值 、 均 值 、 默 认 
值 0) 来 回填 数据 ， 由 于 用 户 的 未 评分 项 不 可 能 完全 相同 ， 导 
致 信任 度 不 高 。 本 文 就 近邻 评分 数据 过 少 ， 先 通过 原始 数据 得 
到 初步 的 用 户 相 似 度 和 每 个 用 户 的 近邻 , 利用 slope one 算法 计 
算 评分 预测 值 来 填充 数据 ， 并 基于 填充 后 的 数据 修正 相似 度 和 
优化 近邻 选取 和 集合， 最 终 给 出 目标 用 户 的 推荐 列表 。 实 验 数 据 
集 来 自 movielen-lm 的 数据 集 ， 采 用 五 折 交 叉 实 验 法 进行 实证 
研究 ， 同 协同 过 滤 算 法 和 基于 均值 填充 后 的 协同 过 滤 算 法 结果 
进行 比较 分 析 。 


1 ”算法 描述 及 模型 设计 


1.1 算法 相关 描述 


Slope One 算法 是 一 种 经 典 的 基于 用 户 -项 目 评分 矩阵 的 推 
荐 算法 ， 该 算法 是 一 个 增 量 算法 ， 对 评分 较 少 的 用 户 也 可 以 产 


生 推 荐 ， 同 时 准确 度 比 传统 的 基于 用 户 和 项 目的 协同 过 滤 算 法 


要 好 5， 故 本 文采 用 Slope One 算法 来 计算 预测 评分 值 。 与 其 
他 类 似 推荐 算法 相 比 ， 它 的 最 大 优点 在 于 算法 很 简单 ， 易 于 实 
现 ， 执 行 效率 高 ， 同 时 推荐 的 准确 性 相对 较 高 02I。 


1.1.1 Slope One 算法 
Slope One 算法 是 基于 不 同 项 目 之 间 的 评分 差 的 线性 算法 ， 
预测 用 户 对 项 目 评分 的 个 性 化 算法 。 主 要 分 两 步 : 
a) 计 算 项 目 之 间 的 评分 差 的 均值 ， 记 为 物品 间 的 评分 偏差 
(两 项 目 同 时 被 评分 ) Pew 如 式 (1) 所 示 。 


< 


(ri — ry) 


Dev, i ueN(DNN(GN) (1) 
INOANCGOA) 


其 中 : nh、 5 分别 为 用 户 4 对 项 目 i 和 项 目 j 的 评分 ，N(i)、 
N() 分别 为 对 项 目 i、j 评 过 分 的 用 户 集合 ，N(i) NGC 是 对 


项 目 i 和 项 目 j 都 评 过 分 的 用 户 集合 ， 是 物品 i 和 
物品 7 都 评 过 分 的 用 户 数 。 
b) 根 据 项 目 间 的 评分 偏差 和 用 户 的 历史 评分 ， 预 测 用 户 对 
未 评分 的 项 目的 评分 pi 如 式 (2) 所 示 。 
>》 INO MN NCOD|x Gr, + dev,) 
pa = 0O) 


> |NOmNC 


ieN(u) 
其 中 : N(w) 是 用 户 4 评 过 分 的 物品 。 
1.1.2 协同 过 滤 
“协同 过 滤 ” 


词 最 早 是 由 GlodBerg 等 人 05 在 20 世纪 90 


而 本 文 研究 的 主要 内 容 是 对 基于 内 存 下 的 UBCF 算法 的 改进 。 
其 中 ， 基 于 内 存 是 在 内 存 当 中 都 需要 维护 一 个 庞大 的 相似 度 算 
阵 , 并 采用 一 定 的 启发 式 为 用 户 推 荐 , 也 称 为 基于 领域 (domain- 
based ) 或 基于 记忆 (memory-based); 基于 项 目 或 基于 物品 (item- 
based collaborative filtering，IBCF ) ; 基于 


户 (user-based 


collaborative filtering, UBCF) 。 


UBCF 


基于 内 存 


IBCF 


(机 器 学 习 和 数据 挖 
掘 的 模型 ， 包 括 回 

归 、 奇 异 值 分 解 
(SVD) 聚 类 、 贝 叶 
斯 网 络 、 马 尔 可 夫 、 
关联 规则 、 


极 大 业 、 
基于 模型 概率 相关 模型 ) 


图 1 协同 过 滤 推 荐 算法 分 类 


ek 


1.1.3 相似 度 

相似 度 是 指 两 个 用 户 对 同一 个 项 目的 喜好 程度 (用 户 相似 
度 ) 或 者 两 个 项 目 被 同一 个 用 户 喜 好 的 相似 程度 (项 目 相似 度 )。 
协同 过 滤 算 法 中 常用 相似 度 有 : 欧式 距离 相似 度 、Jaccard 相似 
度 、 余 强 相 似 度 、 修 正 的 余弦 相似 度 、Pearson 相似 度 0417 等 。 
于 余弦 相似 度 在 数据 越 稀 疏 的 情况 下 ， 效 果 更 好 ， 故 本 文 在 
处 理 初始 评分 矩阵 和 填充 后 的 评分 矩阵 过 程 中 ， 统 一 使 用 余弦 


相似 度 。 余 弦 相 似 度 公式 如 式 (3) 所 示 。 
> R,， xR,, 
SIM 六 二 ee (3) 
SRR 
其 中 : wu 、v 代表 用 户 ，i 代 表 项 目 ，i 表 示 项 目 集合 ，R 表 


示 用 户 4 对 项 目 i 的 评分 值 ，R&,j; 为 用 户 对 4 对 项 
1.1.4 协同 过 滤 一 般 流程 

传统 协同 过 滤 算 法 的 推荐 流程 一 般 分 为 四 个 步骤 如 图 2 所 
示 ， 本 文 改进 的 工作 主要 在 二 三 两 个 步骤 之 间 ， 使 
算法 来 作 空缺 值 填充 ， 从 而 构建 稀疏 度 较 低 的 评分 和 矩阵 。 


j 的 评分 。 


4 slope-one 


、 收 集 


四 、 最 终 推荐 结 
二 光洁 二 > 


| 1 ee 盖 一》 果 : top-N 推 荐 集 


四 2 ”传统 协同 过 滤 算 法 的 一 般 流程 


1.2 基于 slope one 算法 改进 评分 矩 阵 填充 的 模型 设计 
基于 上 面 的 内 容 ， 本 文 改进 算法 的 模型 如 图 3 所 示 。 
1.2.1 模型 描述 

该 模型 主要 分 为 两 大 模块 : 1 ) slope-one 算法 改进 评分 矩阵 
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录用 稿 


填充 模块 : 首先 利用 slope-one 算法 在 原始 用 户 - 项 目 评分 矩阵 
中 计算 用 户 世 对 项 目 ; 的 可 能 评分 值 ， 区 别 于 其 他 空 值 填补 法 
(均值 、 中 值 等 ) 填 补 的 单一 和 可 靠 性 , 该 算法 计算 出 的 预测 值 从 


1-5 都 有 可 能 ， 接 着 用 该 评分 预测 值 一 一 回填 原始 稀 琉 的 用 户 - 


a 


向 小 东 ， 


两 个 数据 即 movies.dat 和 ratings.dat 。 


Xv 合作 期 和 


Chi 
: 基于 SlopeOne 算 ge peasy 协同 过 滤 算 


二 | 


数据 表示 


评分 矩阵 得 到 处 理 后 的 用 户 -项 目 和 矩阵 。2〉 基 于 用 户 的 协同 过 
渡 算 法 推荐 模块 : 在 填充 后 的 用 户 -项 目 i ， 本 文 用 公 
式 (3) 计算 用 户 间 的 相似 度 ， 相似 度 排序 得 到 前 n 个 邻居 构成 
的 近邻 集 S; 接着 对 S 中 的 所 有 项 目 对 ] 户 的 推荐 度 排 
序 ， 得 到 前 n 个 项 目 组 成 的 推荐 结果 集合 。 


户 间 相似 性 


1 人 A A y 
| 初始 用 户 - 项 -项 目 | | | 填充 后 的 用 户 - | > 
(| 项 目 评分 短 隆 | 


通过 余弦 相似 性 计算 
开 妇 月 


评分 矩阵 相似 性 比较 产生 过 人 
集合 S 
y 
s 中 所 有 项 目 对 目标 
本 预测 值 一 一 回填 初 用 户 的 推荐 度 
Slope-one 算 法 计算 田 户 -项 日 评 
0 一 党 | 目 评分 矩 
将 推荐 度 最 大 的 N 个 
Slopeone 算 法 进行 矩阵 填充 异 块 项 目 推荐 个 目标 
图 3 ”slope-one 算法 改进 抢 阵 填充 算法 模型 


1.2.2 算法 流程 


基于 上 面相 关 概 念 及 算法 模型 ， 对 本 文 改 进 算法 的 算法 流 
程 描述 如 下 所 示 ; 
slope-one 算法 
1、 根 据 输入 的 用 户 评分 和 项 目 信息 ， 初 始 化 得 稀疏 的 “用 户 -项 目 ” 评 
分 矩阵 
2、for each in : (对 共同 评价 过 项 目 i/j 的 用 户 集合 中 的 每 位 
户 u) 用 式 (1) 计 算 项 目 与 其 他 项 目的 评分 偏差 
3、for each in : (对 每 个 用 户 未 评价 的 项 目 集合 :中 的 每 个 ) 
式 (2) 计 算 用 户 对 项 目 的 评分 预测 值 
4、 预 测 值 回 填 初 始 “ 用 户 - 项 目 ” 评 分 惩 阵 ， 得 填充 后 的 “用 户 - 项 目 ” 
评分 矩阵 
5、 根 据 填充 后 的 “用 户 -项 目 ” 评 分 矩阵 用 公式 (4) 计 算 用 户 间 相似 性 
6、 相 似 性 排序 ， 得 到 前 k 个 用 户 组 成 近邻 集 S 
7、 近 邻 集 S 的 所 有 项 目的 推荐 度 计算 并 排序 ， 采 用 top-N 得 推荐 结果 
集 
8、 对 测试 集中 的 项 目 ， 做 评分 预测 
2 ， 仿真 实验 与 结果 分 析 
2.1 实验 数据 
实验 的 数据 集 使 用 的 是 由 美国 明尼苏达 州立 大 学 的 
GrouLens 研究 小 组 发 布 的 MovieLens 标准 数据 集 08]。 本 文 实验 
使 用 的 是 1M 的 数据 集 ， 其 中 包括 6040 个 独立 用 户 对 3952 部 


电影 作品 的 1,000,209(100 万 余 ) 条 评分 数据 ,数据 稀 疏 程度 为 1- 
1000209/(6040*3952)=0.9581 。 该 数据 集 包 括 了 三 个 数据 文件 : 


存储 用 户 基 本 信息 的 users.dat, 存储 电影 基本 信息 的 movies.dat 
和 存储 用 户 对 电影 评分 信息 的 ratings.dat。 本 文 实验 测试 用 到 后 


部 
ratings.dat 文件 


所 是 1~5 的 整数 ， 


电影 信 


中 每 一 


vv》 


movies.dat 文件 中 每 一 
其 格式 为 MovieID::Title::Genres ; 
条 数据 表示 一 个 “用 


汪 轨 


条 


户 -电影 ”评分 信息 ， 
其 格式 为 UserID::MovieID::Rating::Timestamp， 其 中 rating 范 


分 数 越 高 ， 表 示 该 用 户 


对 该 电影 


的 喜好 程度 


越 大 。 
2.2 评测 指标 

评测 推荐 系统 质量 的 主要 度量 标准 有 统计 准确 度 和 决策 文 
持 准 确 度 。 常 见 统计 准确 度 指标 有 用 户 满意 度 、 预 测 准确 度 、 
多 样 性 、 惊 喜 度 、 新 颖 性 、 实 时 性 、 健 壮 性 、 信 任 度 、 商 业 目 
标 。 目 前 在 对 离线 实验 进行 评价 的 时 候 主要 采用 预测 准确 度 、 
Top N 推荐 和 有 覆 盖 率 5? 20， 本 文采 用 采用 预测 准确 度 和 top- 


ON 


引 预 测 准确 度 一 般 通 过 均 方 根 误差 RMSE) 和 平均 绝对 误 
差 (MAB) 计 算 ， 本 文选 取 后 者 (MAE) 公 式 如 式 (4) 所 示 。 
MAE = 1 。 (0) 
加 
其 中 :是 用 户 w 对 项 目 i 的 实际 评分 ，x 为 算法 给 出 的 预测 
评分 ，7 为 测试 集 内 所 有 项 目 集 ，|7| 为 该 项 目 集 的 大 小 。 
b)Top_N: 一 般 通过 准确 率 (precision)、 召回 率 (recall)) 和 综合 
值 F 度量 ， 公 式 如 式 (5)~(7) 所 示 。 
SRO NTE) 
Precision = 和 一 一 -一 SR (5) 
DRO) MT) 
Recall = “一 一 一 一 一 Sr (6) 
_ 2xPrecision x Recall 0) 
Precision + Recall 
其 中 : R(w) 是 用 户 在 训练 集 上 的 行为 给 用 户 给 出 的 推荐 列表 ， 


而 T(w) 是 用 户 在 测试 全 


2.3 ”实验 设计 与 结果 分 析 


实验 采 


rating 作为 训练 集 | 


验 过 程 中 采用 


结果 的 影响 。 


上 的 行为 列表 。 


j Python 程序 设计 仿 
于 训练 模型 


， 剩 


环境 , 将 80% 的 评分 数据 集 
余 20% 作 为 测试 集 。 
5 折 交 又 实验 验证 以 避免 随机 性 、 侦 然 怕 


,在 实 
FE 对 实验 


即 在 Python 程序 中 设置 5 个 不 同 随机 种 子 ， 将 


rating 数据 集 分 成 5 份 互 不 相交 的 子 集 ， 每 次 选取 其 中 1 份 作 


为 测试 数据 集 
份子 集 依次 作 
图 4 展示 


进行 测试 ， 
为 测试 集 。 


了 UBCEF 算法 


、 基 于 均值 填 


及 本 文 改进 算法 的 预测 准确 度 MAE 随 邻 


图 可 


以 看 出 均 


值 填充 矩阵 算法 


充 的 协同 过 滤 算 法 
了 居 数 变化 的 趋势 。 


剩余 4 份 作为 训练 集 ， 进 行 $ 次 即 每 


以 
从 


同 UBCF 算法 的 平均 绝对 偏差 都 


比较 大 ; 而 经 由 slope-one 改进 矩阵 填充 的 算法 的 平均 绝对 1 
算法 的 结果 差别 不 是 


MAE 较 小 ，3 
很 显著 ,说明 


并 且 均 值 改进 算法 


均值 填充 矩阵 算法 效果 不 是 很 日 


和 UBCF 


前 差 


明显 ， 而 本 文 改进 
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滤 算 法 的 失 


别 描述 了 随 着 推荐 
及 综合 值 的 变化 趋势 。 


录用 稿 


后 的 算法 的 评分 预测 准确 度 相 比 于 协同 过 滤 算 法 和 均值 改进 算 


法 都 有 较为 显著 的 提高 。 另 外 ， 当 天 <80 时 ， 本 文 改进 算法 的 


MAE 随 着 参数 的 不 断 增 大 而 减 小 ; 当天 >80 时 , 该 MAE 值 


趋 于 平稳 。 


一 $9 一 :lope-one 改 进 矩阵 填 
充 
下 一 average 改 进 矩阵 填充 
15 一 如- UBCF 算 法 
10 
5 
0 T T T T T 


20 40 60 80 100 120 


图 4 


三 种 算法 平均 绝对 偏差 的 折线 图 比较 


为 了 充分 证 明 slope-one 算法 改进 评分 填充 矩阵 的 协同 过 
E 荐 准确 性 ， 实 验 还 采用 了 precision 和 recall 以 及 综 
合 值 三 种 分 类 准确 度 评价 指标 来 作 比 较 。 图 5、 图 6、 图 7 分 
项 目 数 的 变化 各 算法 的 precision 和 recall 以 


从 图 5 三 种 算法 的 准 


确 率 折 线 图 可 以 看 出 ， 


三 种 算法 的 准 


确 率 变 化 趋势 都 是 先 平 稳 后 上 升 再 有 所 下 降 , 其 中 slope-one 算 
法 改进 矩阵 填充 算法 的 准确 率 最 好 ， 
的 准确 率 居 中 , 说 明 两 者 对 协同 过 
而 本 文 提 出 的 算法 改进 效果 更 加 明显 。 从 图 6 三 种 算法 的 召 世 
率 折 现 图 可 以 看 出 ， 


均值 改进 矩阵 填充 的 算法 
滤 算 法 都 有 一 定 的 改进 效果 ， 


三 种 算法 的 召回 率 变 化 趋势 则 为 先 平 稳 后 


降 再 有 所 上 升 。 召 世 a tl 


Xiy 例 作 期 刊 、 


Chi 
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" N33 


单一 的 问题 
先 从 初始 用 户 -项 目 评 分 矩阵 出 发 由 Slope One 算法 计算 评分 预 


村 一 4 一 slope-one 改 进 拒 阵 填充 
5 再 一 和 一 average 改进 拒 阵 填充 
本 UBCF 算 法 
6 
4 
> 
0 
20 40 60 80 100 120 
图 6 三 种 算法 召回 率 的 折 现 图 比较 
11.4 
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.于 -一 一 重 - average 改 进 矩阵 填充 
人 104 pS 
¥ 后 > 
站 pe UBCF 算 法 
10 9 
2 一 鳃 :lope-one 改 进 矩阵 填 
9.6 - 充 
9.4 
9.2 


WBk 20 40 60 80 10 120 


图 7 


三 种 算法 准确 率 召 回 率 的 综合 指标 f 值 的 折线 图 比较 


结束 语 


针对 传统 协同 过 滤 算 法 的 评分 数据 稀疏 和 空 值 填补 法 过 于 
,本 文 提出 基于 Slope One 算法 改进 评分 填充 矩阵 ， 


于 在 个 性 化 推荐 中 ， 召 回 率 和 准确 率 往 往 是 相悖 的 ， 通 常 准 


确 率 的 提高 都 是 以 牺牲 召回 率 为 代价 的 。 
线 图 可 
从 而 也 能 


Ee 


测 值 后 再 对 稀疏 和 窍 


阵 进行 填充 ， 在 一 定 程度 上 缓解 了 协同 过 滤 


结合 图 5、 图 6 的 


以 看 出 本 文 改 进 算法 使 得 推荐 效果 有 了 更 显著 的 提高 ， 
说 明 本 文 提 出 的 改进 算法 有 良好 的 推荐 效果 。 而 图 7 


步 证 实 了 本 文 提出 的 进 算法 的 可 行 性 ， 确 实在 一 定 程度 
推荐 系统 的 推荐 效果 。 


16 
14 
12 UBCF 算 法 


一 中 -average 改进 矩阵 填充 


precision (%) 


一 4 一 slope-one 改 进 矩阵 填 
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三 种 算法 准确 率 的 折线 图 比较 


荐 中 的 数据 稀疏 性 问题 ， 并 弥补 了 空 值 填补 法 填补 值 过 于 单 
的 问题 。 随 后 ,在 填充 后 的 用 户 -项 目 评分 矩阵 下 给 出 推荐 列 


表 及 测试 集 的 预测 值 ， 并 与 其 他 协同 过 滤 推 荐 算法 进行 比较 ， 


结果 表明 本 文 算法 可 以 改善 数据 稀 玻 性 


的 


问题 ， 并 推 高 推荐 系统 


E 荐 质量 。 
本 文 的 局 限 在 于 只 是 简单 的 使 用 了 Slope One 算法 进行 预 
回填 ， 没 有 结合 其 他 方法 深入 的 对 预测 值 进行 进一步 的 筛 


选 ， 下 一 步 的 工作 准备 针对 该 问题 进行 深入 研究 和 完善 。 
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